Et aussi sur le Web 

• Tous les items en version 

PDF 

• Tests de lecture 

• Qu’est-ce qui peut tomber 
a 1’examen? Les reponses 

• Des phototheques 

• Des quiz 

• Des videos 

• Des interviews 



Les « datasets » : 
une triple evolution 


Jean-Michel Chabot n avril 2014, une interrogation Google avec 

Faculte de medecine les term es « dataset » ou « set minimal de 

Marseille donnees cliniques » renvoyait a pres de 

300 000 resultats (ce qui n’est pas considerable). 
Parmi ces resultats, on retrouve avec une frequence 
particuliere une publication de 201 1 , par une equipe 
de I’universite du Minnesota, jointe aux Actes de la 
reunion annuelle de Y American Medical Informatics 
Association (association professionnelle, constitute 
voila plus de 30 ans et dont la mission est d’exercer 
le leadership afin d’assurer, via la recherche, la 
formation et les bonnes pratiques en informatique, 
la mutation du systeme de sante [http://www.amia. 
org/ about-amia/mission-and-history]). 

Cette publication 1 par une equipe pluridisciplinaire 
faisait le constat de I’importance croissante de la 
notion de dataset et deplorait - avec I’intention 
immediate d’y remedier- I’absence d’indications 
et de methode afin de developper de tels « sets de 
donnees cliniques ». 

Des auteurs frangais, se referant volontiers a la 
publication de leurs collegues du Minnesota, ont 
propose la definition suivante du « minimum data- 
set » : jeu de donnees commun, necessaire pour 
remplir un objectif determine (http://fr.slideshare.net/ 
fullscreen/isyrare/dfinition-du-minimum-dataset- 
bamara-bndmr/1). Ces memes auteurs, dans un 
article consacre a I’interoperabilite des bases de 
donnees, avancent une definition fonctionnelle 
dans les termes suivants : Le concept de « mini- 
mum dataset » s’ est developpe pour mettre en 
oeuvre des etudes a grande echelle dans le domaine 
de la sante avec des donnees comparables. Des 


minimums datasets sont generalement proposes 
pour des etudes specifiques ... et pour la mise en 
oeuvre de registres (http://www.bndmr.fr/ wp-content/ 
uploads/201 4/02/MDS-IC201 2-CH0QUET.pdf). 

Des lors, on peut aisement preciser la finalite 
recherchee par I’elaboration de ces datasets : il 
s’agit de determiner un nombre minimal de don- 
nees - cliniques, s’agissant de sante et de maladie, 
a I’echelon de I’individu ou de groupe(s) de malades - 
qui permettent, avec un bon degre de validite, de 
caracteriser un diagnostic, de suivre revolution et 
d’echanger entre profession nels interesses/impliques. 
12 informatisation croissante des professionnels de 
sante et le regroupement de ces professionnels 
pour constituer des equipes plus ou moins formali- 
sees - et les echanges d’informations que cela 
implique - constituent evidemment un contexte 
favorable pour I’elaboration de ces datasets. C’est 
de ce point de vue que I’equipe de I’universite du 
Minnesota s’est placee pour proposer son cadre 
methodique de production de datasets. 

Selon ce cadre, un set minimal de donnees cliniques 
s’inscrit dans les 5 dimensions suivantes : 

- c’est un ensemble de donnees standardises 
coherentes et explicitement articulees ; 

- developpe en utilisant une approche empirique 
explicite pour definir et nommer les constructions 
cliniques pertinentes ; 

- congu pour representer et capturer les donnees 
de fagon optimale a I’interface patient/terminal 
du systeme d’information (a portee du medecin) ; 

- implements de telle fagon qu’il peut etre integre avec 
d’autres sets de donnees (sur d’autres maladies) ; 
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- oriente vers r acquisition de connaissances exploi- 
tables sur un terminal du systeme d’ information. 
Dans des termes plus profanes, c’est done un 
ensemble de donnees cliniques qui permet de sui- 
vre au mieux revolution d’un malade. Cet ensemble 
de donnees cliniques est volontairement I i mite aux 
donnees sur lesquelles la plupart des analyses de 
I’etat du malade sont etablies et aux decisions qui en 
decoulent. En pratique, un dataset pour une maladie 
commune comme la BPCO ou I’insuffisance renale 
comporte moins de 1 0 donnees cliniques. 

Etablir les donnees qui constituent un dataset neces- 
site de croiser une expertise (fondee sur une appro- 
che de type EBM, e’est-a-dire associant r analyse de 
la litterature et attentive au contexte d’exercice et aux 
expressions du patient) et des retours d’experiences 
comme peuvent le faire des praticiens de terrain. Et 
rmeme s’il est stabilise, un dataset a vocation a etre 
regulierement actualise et ameliore. 

Ce sont sur les donnees reunies dans un dataset 
que le travail en equipe au sein d’un regroupement 
professionnel (maison ou pole de sante) s’elabore. 
Ainsi, on peut considerer qu’un dataset constitue 
la forme la plus concise, la plus fonctionnelle, d’un 
protocole partage pluriprofessionnel. 

Des lors que les donnees sont limitees en nombre, 
il est possible de les « structurer », et done d’orga- 


Extrait d’un travail de la HAS sur les syntheses de donnees cliniques 
constituent le volet medical de synthese* 

Les documents internationaux mettent en evidence trois grands types d’objectifs : 

une « synthese medicale » integree au dossier patient et destinee au praticien (le medecin habituel, 
I’etudiant ou le remplagant) lui permettant, en consultation, d’avoir en un coup d’oeil une presentation de 
la situation Clinique globale du patient ; c’est la valeur d’usage de la « synthese » proposee par le Royal 
Australian College of General Practitioners, le College of Physicians and Surgeons of Ontario et de la 
synthese integree de Stelman sur le site de I’AAFP {American Academy of Family Physician) ; 

■4 des « Patient Summaries » pour alimenter les dossiers medicaux partages ( Electronic Health Pecord-like 
System) avec, d’une part, des versions minimales pour faire face aux situations d’urgence : c’est le cas 
de : Summary Care Record au Royaume-Uni, Emergency Care Summary en Ecosse, epSOS ‘ Minimum 
Dataset entre pays europeens ; et, d’autre part, des versions avec davantage de contenu pour permettre 
une meilleure coordination des soins dans le cadre de soins non programmes comme le SumEHR 
en Belgique, les Condition Specific Summaries qui s’ajoutent au Minimum Dataset en Finlande, 
le National Patient Summary suedois (NPO), le Patient Summary Extended du projet epSOS ; 

des syntheses medicales destinees a etre transferees electroniquement entre professionnels de sante 
ou entre professionnels et etablissements de sante. Les documents analyses decrivent le contenu metier 
mais aussi les regies d’interoperabilite. Sont retenus ici : 

- le « Patient Summary Record » qui contient les donnees minimales a transmettre dans le cadre 

d’un echange via SI entre medecins, defini par le Department of Health and Human Services americain ; 

- le « Medical Summary » qui est le contenu minimum d’une synthese medicale defini par I’lHE PCC 
[Integrating the Healthcare Entreprise Patient Care Coordination ) ; 

- le « Referral Summary » qui definit les donnees que devraient contenir une synthese accompagnant 
la demande d’un avis aupres d’un autre specialiste selon I’lHE PCC. 

* http://www.has-sante.fr/portail/upload/docs/application/pdf/2013-04/synthese_medicale_queLcontenu_analyse_bibliographique.pdf 


niser leur regroupement et leur combinaison (qui 
s’operent automatiquement). Ces regroupements 
et ces combinaisons conduisent a deux grandes 
fonctionnalites que les professionnels utilisent 
presque constamment au cours de leur exercice : 

- d’abord une assistance « en temps reel » a I’exer- 
cice (par la production de memos ou d’alertes 
qui peuvent etre appeles a I’ecran - y compris 
d’un smartphone - des lors que la situation d’un 
malade y incite) ; 

- ensuite par une analyse immediate puis differee 
des parcours des malades, autant en termes 
individuels qu’en termes de cohorte. 

De surcroTt, ces datasets, les donnees qui les 
constituent et les analyses qui peuvent en etre fai- 
tes, sont de premiere utilite quand un malade doit 
etre refere a un professionnel ou a un plateau tech- 
nique de deuxieme recours (en particulier par la 
production fiabilisee d’un « resume de transfer! ou 
de sortie » [v. encadre]) 

Bret, ces datasets (dont la production a debute 
dans notre monde de la sante) represented trois 
evolutions en cours et constituent trois zones d’im- 
pact de la reorganisation de notre systeme de 
soins, et en particulier de soins primaires : 

- d’abord dans la formation des professionnels, 
puisqu’au-dela des habituelles notions generale- 
ment exhaustives, exposees au cours des cycles 
academiques, I’identification des datasets et des 
elements qui les constituent represented une 
nouvelle presentation, quasiment « fonctionnelle » 
de I’exercice de la medecine ; 

- ensuite pour I’exercice des professionnels, en 
particulier dans le cas des regroupements, 
puisque ce sont ces datasets qui constituent la 
base des protocoles partages, autour desquels 
se construisent I’exercice en equipe et les par- 
cours des malades ; 

- enfin, sur la regulation de I’activite des profes- 
sionnels, puisque les analyses et evaluations 
generees a partir des datasets produisent des 
indicateurs qui peuvent etre utilises autant pour 
des aspects populationnels (epidermiologie Cli- 
nique ou plus simplement analyse de patientele) 
que sur des aspects financiers et economiques 
(en particulier support a des remunerations d’e- 
quipe ou individuelles, dans un cadre contractuel 
ou de performance).* 

1 . Svensson-Ranallo PA, Adam TJ, Sainfort F. A framework and 
standardized methodology for developing minimum clinical datasets. 
AMIA Summits Transl Sci Proc 201 1 ;201 1 :54-8. 
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